Histogram, Box Plot এবং Scatter Plot

Machine Learning - পাইথন ডেটা সায়েন্স (Python Data Science) - Data Visualization with Matplotlib এবং Seaborn
232

ডেটা ভিজ্যুয়ালাইজেশন হল ডেটার প্যাটার্ন, প্রবণতা এবং সম্পর্ক সনাক্ত করার একটি গুরুত্বপূর্ণ অংশ। Python-এর Matplotlib এবং Seaborn লাইব্রেরি ডেটা ভিজ্যুয়ালাইজেশনের জন্য বিভিন্ন ধরনের প্লট সরবরাহ করে। এই প্লটগুলির মধ্যে Histogram, Box Plot, এবং Scatter Plot ডেটার বিশ্লেষণের জন্য খুবই উপকারী।

১. Histogram

Histogram একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন যা ডেটার ডিস্ট্রিবিউশন (বণ্টন) এবং ঘনত্ব (frequency) দেখায়। এটি ডেটার বিভিন্ন মানের ফ্রিকোয়েন্সি বা ঘনত্ব সনাক্ত করার জন্য ব্যবহৃত হয়। সাধারণত, bins বা পরিসরের সাহায্যে বিভিন্ন মানের সংখ্যা শ্রেণিবদ্ধ করা হয়।

ব্যবহার:

  • ডেটার বণ্টন, সেন্ট্রাল টেনডেন্স এবং স্প্রেড দেখানোর জন্য।
  • ডেটার মধ্যে কোন মান বেশি বা কম পাওয়া যাচ্ছে তা দেখানোর জন্য।

উদাহরণ (Matplotlib):

import matplotlib.pyplot as plt
import numpy as np

# উদাহরণ ডেটা
data = np.random.randn(1000)

# Histogram তৈরি
plt.hist(data, bins=30, edgecolor='black')

# শিরোনাম এবং লেবেল
plt.title('Histogram Example')
plt.xlabel('Value')
plt.ylabel('Frequency')

# প্রদর্শন
plt.show()

উদাহরণ (Seaborn):

import seaborn as sns

# উদাহরণ ডেটা
data = np.random.randn(1000)

# Histogram তৈরি
sns.histplot(data, bins=30, kde=True)

# শিরোনাম এবং লেবেল
plt.title('Histogram with KDE')
plt.xlabel('Value')
plt.ylabel('Frequency')

plt.show()

২. Box Plot

Box Plot (বা Box-and-Whisker Plot) হল একটি ভিজ্যুয়ালাইজেশন টুল যা ডেটার spread, central tendency, এবং outliers দেখাতে ব্যবহৃত হয়। এটি ডেটার মধ্যম, কোয়ারটাইল (Quartile), এবং এক্সট্রিম (Extreme) ভ্যালুগুলি প্রদর্শন করে।

ব্যবহার:

  • ডেটার মাঝারি মান, এবং ২৫%-৭৫% পরিসরের মধ্যে কতটা পরিবর্তন হচ্ছে তা দেখানোর জন্য।
  • ডেটার আউটলাইয়ার (অস্বাভাবিক মান) সনাক্ত করার জন্য।

উদাহরণ (Matplotlib):

import matplotlib.pyplot as plt
import numpy as np

# উদাহরণ ডেটা
data = np.random.randn(100)

# Box Plot তৈরি
plt.boxplot(data)

# শিরোনাম এবং লেবেল
plt.title('Box Plot Example')
plt.xlabel('Data')
plt.ylabel('Value')

# প্রদর্শন
plt.show()

উদাহরণ (Seaborn):

import seaborn as sns
import numpy as np

# উদাহরণ ডেটা
data = np.random.randn(100)

# Box Plot তৈরি
sns.boxplot(data=data)

# শিরোনাম এবং লেবেল
plt.title('Box Plot Example')
plt.xlabel('Data')
plt.ylabel('Value')

plt.show()

৩. Scatter Plot

Scatter Plot হল একটি গ্রাফিক্যাল রিপ্রেজেন্টেশন যা দুইটি চলক বা ভেরিয়েবলের মধ্যে সম্পর্ক প্রদর্শন করে। এটি সাধারণত ডেটার মধ্যে যে কোনো সম্পর্ক (positive, negative, বা no correlation) দেখানোর জন্য ব্যবহৃত হয়।

ব্যবহার:

  • দুইটি ভেরিয়েবলের মধ্যে সম্পর্ক বা কোরিলেশন (correlation) পরীক্ষা করার জন্য।
  • ট্রেন্ড বা প্যাটার্ন সনাক্ত করতে।

উদাহরণ (Matplotlib):

import matplotlib.pyplot as plt
import numpy as np

# উদাহরণ ডেটা
x = np.random.rand(100)
y = 2 * x + 1 + np.random.randn(100) * 0.1

# Scatter Plot তৈরি
plt.scatter(x, y)

# শিরোনাম এবং লেবেল
plt.title('Scatter Plot Example')
plt.xlabel('X')
plt.ylabel('Y')

# প্রদর্শন
plt.show()

উদাহরণ (Seaborn):

import seaborn as sns
import numpy as np

# উদাহরণ ডেটা
x = np.random.rand(100)
y = 2 * x + 1 + np.random.randn(100) * 0.1

# Scatter Plot তৈরি
sns.scatterplot(x=x, y=y)

# শিরোনাম এবং লেবেল
plt.title('Scatter Plot Example')
plt.xlabel('X')
plt.ylabel('Y')

plt.show()

সারাংশ

  1. Histogram: এটি ডেটার বণ্টন এবং ফ্রিকোয়েন্সি দেখানোর জন্য ব্যবহৃত হয়। এটি সাহায্য করে ডেটার বিভিন্ন মান কতবার ঘটেছে তা বিশ্লেষণ করতে।
  2. Box Plot: এটি ডেটার স্প্রেড, মধ্যম (Median), কোয়ারটাইল (Quartile), এবং আউটলাইয়ার (Outliers) সনাক্ত করতে সহায়ক।
  3. Scatter Plot: এটি দুটি চলক বা ভেরিয়েবলের মধ্যে সম্পর্ক দেখতে ব্যবহৃত হয়। ডেটার মধ্যে প্যাটার্ন বা কোরিলেশন (correlation) সনাক্ত করতে ব্যবহৃত হয়।

এই তিনটি প্লট ডেটা ভিজ্যুয়ালাইজেশন, বিশ্লেষণ এবং সিদ্ধান্ত গ্রহণের ক্ষেত্রে অত্যন্ত গুরুত্বপূর্ণ টুলস।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...